Serveur d'exploration sur l'OCR

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Une approche structurelle pour la reconnaissance de notices bibliographiques

Identifieur interne : 000347 ( France/Analysis ); précédent : 000346; suivant : 000348

Une approche structurelle pour la reconnaissance de notices bibliographiques

Auteurs : Y. Chenevoy [France] ; Abdel Belaïd [France]

Source :

RBID : Pascal:96-0309436

Descripteurs français

English descriptors

Abstract

Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.

Url:


Affiliations:


Links toward previous steps (curation, corpus...)


Links to Exploration step

Pascal:96-0309436

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Y" sort="Chenevoy, Y" uniqKey="Chenevoy Y" first="Y." last="Chenevoy">Y. Chenevoy</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>CRID, Université de Bourgogne, Bd Gabriel</s1>
<s2>21000 Dijon</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Bourgogne-Franche-Comté</region>
<region type="old region" nuts="2">Bourgogne</region>
<settlement type="city">Dijon</settlement>
</placeName>
<orgName type="university">Université de Bourgogne</orgName>
</affiliation>
</author>
<author>
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaid">Abdel Belaïd</name>
<affiliation wicri:level="3">
<inist:fA14 i1="02">
<s1>CRIN-CNRS, Campus Scientifique, B.P. 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Alsace-Champagne-Ardenne-Lorraine</region>
<region type="old region" nuts="2">Lorraine</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Alsace-Champagne-Ardenne-Lorraine</region>
<region type="region" nuts="2">Région Lorraine</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">96-0309436</idno>
<date when="1995">1995</date>
<idno type="stanalyst">PASCAL 96-0309436 INIST</idno>
<idno type="RBID">Pascal:96-0309436</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000A02</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000996</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000974</idno>
<idno type="wicri:doubleKey">0765-0019:1995:Chenevoy Y:une:approche:structurelle</idno>
<idno type="wicri:Area/Main/Merge">002D27</idno>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00534043</idno>
<idno type="url">https://hal.inria.fr/inria-00534043</idno>
<idno type="wicri:Area/Hal/Corpus">000164</idno>
<idno type="wicri:Area/Hal/Curation">000164</idno>
<idno type="wicri:Area/Hal/Checkpoint">000169</idno>
<idno type="wicri:doubleKey">0765-0019:1995:Chenevoy Y:une:approche:structurelle</idno>
<idno type="wicri:Area/Main/Merge">002D93</idno>
<idno type="wicri:Area/Main/Curation">002B70</idno>
<idno type="wicri:Area/Main/Exploration">002B70</idno>
<idno type="wicri:Area/France/Extraction">000347</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Y" sort="Chenevoy, Y" uniqKey="Chenevoy Y" first="Y." last="Chenevoy">Y. Chenevoy</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>CRID, Université de Bourgogne, Bd Gabriel</s1>
<s2>21000 Dijon</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Bourgogne-Franche-Comté</region>
<region type="old region" nuts="2">Bourgogne</region>
<settlement type="city">Dijon</settlement>
</placeName>
<orgName type="university">Université de Bourgogne</orgName>
</affiliation>
</author>
<author>
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaid">Abdel Belaïd</name>
<affiliation wicri:level="3">
<inist:fA14 i1="02">
<s1>CRIN-CNRS, Campus Scientifique, B.P. 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Alsace-Champagne-Ardenne-Lorraine</region>
<region type="old region" nuts="2">Lorraine</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Alsace-Champagne-Ardenne-Lorraine</region>
<region type="region" nuts="2">Région Lorraine</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">TS. Traitement du signal</title>
<title level="j" type="abbreviated">Trait. signal</title>
<idno type="ISSN">0765-0019</idno>
<imprint>
<date when="1995">1995</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">TS. Traitement du signal</title>
<title level="j" type="abbreviated">Trait. signal</title>
<idno type="ISSN">0765-0019</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Bibliography</term>
<term>Document analysis</term>
<term>Document structure</term>
<term>Pattern recognition</term>
<term>SGML</term>
<term>Technical instructions</term>
<term>UNIMARC format</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Analyse documentaire</term>
<term>Reconnaissance forme</term>
<term>Notice</term>
<term>Bibliographie</term>
<term>Structure document</term>
<term>SGML</term>
<term>Format UNIMARC</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr">
<term>Bibliographie</term>
</keywords>
<keywords scheme="mix" xml:lang="fr">
<term>Analyse documentaire</term>
<term>Bibliographie</term>
<term>Bibliography</term>
<term>Document analysis</term>
<term>Document structure</term>
<term>Format UNIMARC</term>
<term>Notice</term>
<term>Pattern recognition</term>
<term>Reconnaissance forme</term>
<term>SGML</term>
<term>Structure document</term>
<term>Technical instructions</term>
<term>UNIMARC format</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
<region>
<li>Alsace-Champagne-Ardenne-Lorraine</li>
<li>Bourgogne</li>
<li>Bourgogne-Franche-Comté</li>
<li>Lorraine</li>
<li>Région Lorraine</li>
</region>
<settlement>
<li>Dijon</li>
<li>Nancy</li>
<li>Vandœuvre-lès-Nancy</li>
</settlement>
<orgName>
<li>Centre national de la recherche scientifique</li>
<li>Institut national de recherche en informatique et en automatique</li>
<li>Laboratoire lorrain de recherche en informatique et ses applications</li>
<li>Université de Bourgogne</li>
<li>Université de Lorraine</li>
</orgName>
</list>
<tree>
<country name="France">
<region name="Bourgogne-Franche-Comté">
<name sortKey="Chenevoy, Y" sort="Chenevoy, Y" uniqKey="Chenevoy Y" first="Y." last="Chenevoy">Y. Chenevoy</name>
</region>
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaid">Abdel Belaïd</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Ticri/CIDE/explor/OcrV1/Data/France/Analysis
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000347 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/France/Analysis/biblio.hfd -nk 000347 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Ticri/CIDE
   |area=    OcrV1
   |flux=    France
   |étape=   Analysis
   |type=    RBID
   |clé=     Pascal:96-0309436
   |texte=   Une approche structurelle pour la reconnaissance de notices bibliographiques
}}

Wicri

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024